نوشته شده توسط : سئوکار

مقدمه:

توضیحات تصویر شامل تولید یک توصیف متنی معنادار با توجه به یک تصویر است. این مساله ای آسان برای یک انسان است، اما برای یک ماشین بسیار چالش برانگیز است؛ زیرا هم شامل درک محتوای یک تصویر است و هم اینکه چگونه می توان این درک را به یک زبان طبیعی ترجمه کرد. اخیرا روش های یادگیری عمیق جانشین متدهای کلاسیک شده و در حال دستیابی به نتایج پیشرفته تری برای حل مشکل تولید خودکار توضیحات تصویر است.
در این مقاله خواهید دید که چگونه می توان از مدل های شبکه عصبی عمیق برای تولید خودکار توضیحات تصویر استفاده کرد.
پس از مطالعه این مقاله موارد زیر را درک خواهید کرد:
• درباره چالش تولید توضیحات تصویر و لزوم ترکیب پیشرفت های حاصل از بینایی رایانه ای و پردازش زبان طبیعی.
• درباره عناصر یک مدل عصبی توضیح تصویر، یعنی استخراج ویژگی و مدل زبان
• چگونگی چیدمان عناصر مدل در رمزگذار-رمزگشا (توسط مکانیسم اتنشن (Attention Mechanism))
این مقاله به سه بخش کلی تقسیم می شود:
١. توضیحات تصویر با متن
٢. مدل عصبی توضیحات تصویر
٣. معماری رمزگذار-رمزگشا

 

١. توضیحات تصویر با متن

توضیحات تصویر شامل تولید توصیف متنی قابل خواندن توسط انسان برای یک تصویر است. نگاهی گذرا به یک تصویر برای یک انسان کافی است تا جزئیات تصویری را درک کرده و به خوبی توصیف کند. اما برای مدل های تشخیص بصری این کار ساده نیست.
به منظور تولید توضیحات تصویر، ابتدا لازم است تا محتوای تصویر به صورت “کلمات” معنی دار ترجمه شده وسپس در قالب “جملات” قابل درک ارائه شوند. این موضوع بینایی رایانه ای و پردازش زبان طبیعی را در هم می آمیزد و یک بحث چالش برانگیز را در ابعاد وسیع تری از هوش مصنوعی مطرح می کند. اما درجه سختی نیز می تواند متفاوت باشد. به مثال های زیر توجه کنید.

• طبقه بندی تصویر

اختصاص دادن برچسب به تصویر از هزاران کلاس برچسب موجود.

توضیحات تصویر و توضیحات تصویر با متن و بینایی رایانه ای

• توضیحات تصویر

تولید توضیح متنی برای یک تصویر

توضیحات تصویر و توضیحات تصویر با متن و بینایی رایانه ای
• حاشیه نویسی تصویر

تولید توضیح متنی برای قسمت خاصی از یک تصویر
توضیحات تصویر و توضیحات تصویر با متن و بینایی رایانه ای
همچنین می توان به تولید توضیحات تصویرهای مختلف در طول یک ویدئو نیز اشاره کرد.
در این مقاله ما روی “توضیحات تصویر” تمرکز می کنیم.

٢. مدل عصبی توضیحات تصویر

مدل های شبکه عصبی برای تسلط در زمینه تولید خودکار توضیحات تصویر به دست آمده اند. روش های غالب پیش از مدل های شبکه عصبی end-to-end برای تولید توضیحات تصویر، شامل روش Template-based ، روش Nearest-neighbor-based و روش اصلاح توضیحات موجود می باشد. ( قبل از استفاده از شبکه های عصبی برای تولید توضیح ، دو رویکرد اصلی غالب بودند. اولین رویکرد، قالب های ایجاد توضیح با توجه به اشیاء و کشف ویژگی های تصویر را شامل می شد. رویکرد دوم مبتنی بر این بود که ابتدا تصاویری مشابه با تصویر مورد نظر که دارای توضیح بودند را از یک پایگاه داده بزرگ بازیابی کرده و سپس توضیحات متناسب با نیاز اصلاح تغییر می کردند. )
مدل های شبکه عصبی برای نوشتن توضیحات تصویر شامل دو عنصر اصلی هستند:

• مدل استخراج ویژگی

مدل استخراج ویژگی، یک شبکه عصبی است که با در نظر گرفتن یک تصویر قادر به استخراج ویژگی های برجسته، اغلب به شکل یک بردار با طول ثابت است.
ویژگی های استخراج شده تمثالی داخلی از تصویر است، نه چیزی که به طور مستقیم قابل درک باشد. یک شبکه عصبی پیچشی به عنوان زیرمجموعه استخراج ویژگی مورد استفاده قرار می گیرد. این شبکه را می توان مستقیماً روی تصاویر موجود در مجموعه داده توضیحات تصویر آموزش داد. از طرف دیگر می توان از یک مدل از قبل آموزش دیده مانند مدل پیشرفته ای که برای طبقه بندی تصویر کاربرد دارد نیز استفاده کرد. استفاده از مدل های عملکرد بالا در مجموعه داده های ImageNet ایجاد شده برای چالش ILSVRC، بسیار محبوب است (مانند مدل گروه هندسی آکسفورد ویژن).

• مدل زبان

بطور کلی ، یک مدل زبان با توجه به کلماتی که در توالی وجود دارند، کلمه بعدی را پیش بینی می کند. در تولید توضیحات تصویر، مدل زبان یک شبکه عصبی است که با توجه به ویژگی های استخراج شده از شبکه قادر به پیش بینی دنباله کلمات در توضیحات و ایجاد توضیحات با توجه به کلماتی است که قبلاً تولید شده اند. استفاده از یک شبکه عصبی بازگشتی به عنوان مدل زبان بسیار مرسوم است. هر خروجی کلمه جدیدی را در دنباله ایجاد می کند.
هر کلمه ای که تولید می شود رمزگذاری شده و به عنوان ورودی برای رمزگشایی در تولید کلمه بعدی مورد استفاده قرار می گیرد. پیشرفت مدل شامل گردآوری توزیع کلمات در کل واژگان برای دنباله خروجی و جستجوی آن برای تولید چندین توصیف ممکن است. سپس می توان توضیحات احتمالی را امتیازدهی نمود. استفده از الگوریتم جستجوی پرتو (Beam Search) برای این منظور رایج است. مدل زبان را می توان مستقل و با استفاده از ویژگی های از پیش محاسبه شده از مجموعه داده های تصویر آموزش داد. همچنین می توان آن را به طور مشترک با شبکه استخراج ویژگی آموزش داد.

٣. معماری رمزگذار-رمزگشا

یک روش محبوب برای ساخت مدل های فرعی استفاده از معماری رمزگذار-رمزگشایی است که در آن هر دو مدل به طور مشترک آموزش داده می شوند. مدل مبتنی بر یک شبکه عصبی پیچشی است که یک تصویر را در یک تمثال فشرده کدگذاری می کند، و به دنبال آن یک شبکه عصبی بازگشتی یک جمله را تولید می کند.
این معماری برای ترجمه ماشینی ایجاد شده است که یک توالی ورودی، مثلاً به زبان فرانسوی، را به عنوان یک بردار با طول ثابت رمزگذاری شده است. سپس یک شبکه رمزگشا به صورت جداگانه کدگذاری را خوانده و دنباله خروجی را به زبان جدید تولید می کند، مثلاً انگلیسی. مزیت این رویکرد علاوه بر مهارت چشمگیر آن این است که می توان یک مدل end-to-end برای مسئله آموزش داد. جهت تطبیق توضیحات تصویر، شبکه رمزگذار یک شبکه عصبی پیچشی است و شبکه رمزگشایی گروهی ای از لایه های LSTM است.
مدل توضیحات تصویر توسط مکانیسم اتنشن (Attention Mechanism)
یک محدودیت در معماری رمزگذار-رمزگشا این است که از یک نمایه با طول ثابت برای نگهداری ویژگی های استخراج شده استفاده می کند. این مورد در ترجمه ماشینی با افزایش توجه به رمزگذاری غنی تر مورد توجه قرار گرفته است. از این روش همچنین می توان جهت بهبود عملکرد معماری رمزگذار-رمزگشا در توضیح تصویر با استفاده از رمزگشایی تصویر استفاده کرد. با استفاده از این روش، رمزگشاها می توانند آموزش ببینند که در هنگام تولید هر کلمه در توضیحات، روی کدام قسمت از تصویر متمرکز باشند.

به مثال زیر توجه کنید:
توضیحات تصویر و توضیحات تصویر با متن و بینایی رایانه ای
جمع بندی
در این مقاله، شما دریافتید که چگونه می توان از مدل های شبکه عصبی عمیق برای تولید خودکار توضیحات تصاویر استفاده کرد. همچنین خواندید:
• درباره چالش تولید توضیحات متنی برای تصاویر و لزوم ترکیب پیشرفت های حاصل از بینایی رایانه ای و پردازش زبان طبیعی.
• درباره عناصری که یک مدل توضیحات تصویر عصبی را دارند ، یعنی استخراج ویژگی و مدل زبان.
• چگونگی چیدمان عناصر مدل در رمزگذار-رمزگشا (توسط مکانیسم اتنشن (Attention Mechanism))



:: برچسب‌ها: یادگیری ماشین , ماشین لرنینگ , هوش مصنوعی ,
:: بازدید از این مطلب : 237
|
امتیاز مطلب : 57
|
تعداد امتیازدهندگان : 12
|
مجموع امتیاز : 12
تاریخ انتشار : جمعه 5 ارديبهشت 1399 | نظرات ()
نوشته شده توسط : سئوکار

پایتون به عنوان زبان ارجح برای آموزش و یادگیری Ml (یادگیری ماشین) مورد استفاده قرار می گیرد . همچنین به عنوان یک زبان برنامه افزودنی برای برنامه هایی که به زبان های دیگر نوشته شده اند و نیاز به رابط های اسکریپت یا اتوماسیون آسان دارند ، قابل استفاده است. یادگیری ماشین با پایتون یک نقطه شروع خوب برای Ml  است و شما می توانید از آن برای استفاده از مدلهای موجود مانند رگرسیون خطی ، رگرسیون لجستیک و SVM استفاده کنید.ولی  اگر در مورد یادگیری ماشین جدی تر هستید بهتر است برخی از کتابهای ریاضیات را نیز درک کنید.  در این مقاله با 8 کارایی شگفت انگیز ماشین لرنینگ با پایتون آشنا خواهیم شد .

کارایی یادگیری ماشین با پایتون

1. سادگی خواندن و نوشتن در پایتون 

تنها دلیل انتخاب پایتون به عنوان زبان مقدماتی برای برنامه نویسی ، سادگی آن است. پایتون ساده اما قدرتمند است. نوشتن پایتون آسان است ودرک آسانی دارد. شرایطی مانند گرفتن کد شما از یک توسعه دهنده دیگر که از مؤلفه های شخص ثالث استفاده می کند به این معنی است که شما نیاز به سرورهای شناختی بسیار کمی دارید. همچنین خوانایی کدها بیشترازچیزی است که نوشته شده است. بنابراین ، سادگی خدمت بزرگی برای پایتون محسوب می شود.

2. مجموعه عظیمی از کتابخانه های مرتبط  در پایتون

پایتون برای اهداف یادگیری ماشینی مجموعه گسترده ای از کتابخانه ها را در اختیار دارد. اینها شامل Python NumPy ، SciPy ، scikit-Learn و موارد دیگر است. که برای تمام کارهای ذاتی یادگیری ماشین کاربرد دارند..
scikit-Learn– برای داده کاوی ، تجزیه و تحلیل داده ها و یادگیری ماشین مناسب است.
pylearn– انعطاف پذیر تر از scikit-Learn میباشد.
کتابخانه ماژولار PyBrain با الگوریتم های یادگیری ماشین انعطاف پذیر ، آسان و قدرتمند و محیط های از پیش تعریف شده برای آزمایش و مقایسه الگوریتم ها مناسب است.
orange – کمک به تجسم و تجزیه و تحلیل داده ها با منبع باز ، دارای مؤلفه هایی برای یادگیری ماشین ، دارای پسوندهایی برای سنجش بیومتریک و استخراج متن، پشتیبانی از داده کاوی از طریق برنامه نویسی بصری یا برنامه نویسی پایتون است.
PyML– چارچوب تعاملی شی گرا برای یادگیری ماشین ، که در پایتون نوشته شده است.
Milk_ دارای SVM ، k-NN ، جنگلهای تصادفی ، درختان تصمیم گیری ، که انتخاب ویژگی را انجام می دهد.
Shogun– ابزار یادگیری ماشین ، متمرکز بر روش های کرنل بزرگ مقیاس و SVM ها میباشد.
Tensorflow_کتابخانه شبکه عصبی سطح بالا میباشد.

برنامه های کاربردی آموزش ماشین با پایتون

1. پیش بینی گزینه های موسیقی

ماشین لرنینگ با پایتون - دستیار صوتی

محصولاتی مانند Genius توسط Apple Music بر آنچه شما گوش می دهید نظارت می کند. بعداً ، می تواند لیستی از آهنگهایی را که احتمالاً ترجیح می دهید به شما پیشنهاد دهد. همچنین آهنگهایی را از لیست پخش شما انتخاب می کند تا کتابخانه هایی مشابه با یکدیگرایجاد شود.

2. کشف مواد مخدر و تشخیص بیماری با الگوریتم های ماشین لرنینگماشین لرنینگ با پایتون _تشخیص مواد مخدرمی توانیم کارهای زیر را به کمک یادگیری ماشین دراین زمینه انجام دهیم :

  • برنامه های کاربردی آموزش ماشین با پایتون
  • غربالگری اولیه ترکیبات دارویی
  • پیش بینی میزان موفقیت بر اساس عوامل بیولوژیکی
  • فن آوری های تحقیق و توسعه مانند نسل بعدی توالی
  • فرآیندهای بیماری را درک کنید.
  • درمان هایی مؤثر برای بیماری ها طراحی کنید.
  • شخصی سازی ترکیبات دارویی.
  • داروهای ارزان تر با همانندسازی بهبود یافته تولید کنید.
  • تحقیق و توسعه روش های تشخیصی و درمانی.

3. تشخیص چهره

تشخیص چهره-یادگیری ماشین با پایتون

امکاناتی مانند تشخیص چهره به کمک ماشین لرنینگ اغلب مواردی است که با Facebook می بینیم. وقتی می خواهیم یک عکس را برچسب گذاری کنیم ، فیس بوک به طور خودکار چند نام را به ما پیشنهاد می دهد و در اکثر اوقات ، نام او برای چهره ای که کشف کرده است به کمک یادگیری ماشینی دقیق است.

4. دستیاران شخصی مجازی 

دستیار شخصی مجازی-ماشین لرنینگ با پایتون
نام هایی مانند سیری و الکسا قابلیت دستیاران مجازی را به خاطر می آورند. ما می توانیم از سیری بخواهیم برایمان تماس بگیرد یا موسیقی بخواند. برای پیش بینی وضع هوا امروز می توانید از الکسا سوال کنید. حتی می توانید زنگ خطر را تنظیم کرده یا پیامک ارسال کنید. فقط باید با آن صحبت کنید و به فرمان شما گوش فرا می دهد.این دستیارها به نحوه تعامل شما با آنها توجه می کنند و از آن استفاده می کنند تا تجربه بعدی شما را بهتر کنند.

 5. خدمات رسانه های اجتماعی

فیسبوک _یادگیری ماشین با پایتون
این برنامه از یادگیری ماشینی برای نظارت بر فعالیت شما استفاده می کند. چه پروفایل هایی را که بازدید می کنید ، چه افرادی را برای آن ها درخواست دوستی میفرستید یا افرادی که درخواست های آنها را می پذیرید وهمینطور افرادی که برچسب گذاری می کنید …
فیس بوک امیدوار است تجربه غنی تری را در پلتفرم خود به شما ارائه دهد ، بنابراین شما مرتباً از یادگیری ماشین با پایتون در آن استفاده خواهید کرد.

6. اتومبیل های خودران 

لتومبیل های خودران با ماشین لرنینگ

این اتومبیل داده ها راجع به اشیاء اطراف و اندازه و سرعت آنها از طریق سنسورها دریافت می کنند و براساس نحوه رفتار آنها ، اشیاء را به عنوان دوچرخه سوار ، پیاده و سایر اتومبیل ها طبقه بندی می کند.سپس از این داده ها برای مقایسه نقشه های ذخیره شده با شرایط فعلی استفاده می کند. چنین اتومبیل هایی از الگوریتم های Machine Vision استفاده می کنند.

7. پشتیبانی آنلاین مشتری

پشتیبانی آنلاین مشتری با ماشین لرنینگ

وب سایتهای آموزشی و سیستم عاملهای خرید اغلب یک گپ زنده را برای کمک به سوالات خود ایجاد می کنند. بازدید کننده ای با کلی سؤال بی جواب ،احتمالاً خرید خود را ترک می کند.ولی برخی از وب سایتها از یک chatbot برای جلب اطلاعات به وب سایت استفاده می کنند و سعی می کنند به سؤالات مشتری بپردازند.

8. نظارت تصویری

نظارت تصویری

قبل از وقوع برخی از جرائم می توان با نظارت و شناسایی رفتار افراد از آنها جلوگیری کرد.ماشین لرنینگ با پایتون  رفتارهایی مانند ایستادن بی حرکت ، چرت زدن روی نیمکت و پیروی از فرد دیگر را می تواند از طریق سیستم نظارت تصویری به انسان هشدار دهد.

9. توصیه های محصول

پشتیبانی مشتری با کمک پایتون و یادگیری ماشین

سیستم عاملهای خرید مانند آمازون و جابونگ متوجه می شوند چه کالاهایی را مشاهده می کنید و محصولات مشابه را برای شما پیشنهاد می کنند. اگر این محصول مورد علاقه شما به دست شما برسد و به خریدی که انجام داده اید منجر شود ، این یک برد برای آنها است. برای تشخیص محصولات به کمک ماشین لرنینگ از لیست دلخواه، سبد خرید و مشاهدات شما استفاده می کنند.

10. برنامه های قیمت گذاری بیمه

برنامه های قیمت گذاری بیمه با یادگیری ماشین
یادگیری ماشینی می تواند تشخیص دهد که آیا راننده احتمالاً در طول مدت بیمه باعث ایجاد یک خسارت بزرگ شده است یا نه . این به شرکت های بیمه اجازه می دهد تا برنامه های بیمه قیمت را بر این اساس تنظیم کنند.

11. ترجمه خودکار

یادگیری ماشین با پایتون

ماشین لرنینگ با پایتون  به ما امکان می دهد یک متن را به زبانی دیگر ترجمه کنیم. الگوریتم ماشین لرنینگ برای این کار از شکل چگونگی قرارگیری کلمات در کنار هم استفاده میکند و سپس از این اطلاعات برای بهبود کیفیت ترجمه استفاده می کنند. با این کار، ما همچنین می توانیم متون روی تصاویر را با استفاده از شبکه های عصبی و شناسایی حروف ترجمه کنیم.

12. تشخیص کلاهبرداری های آنلاین


اگر با PayPal آشنا هستید ، PayPal از یادگیری ماشینی برای دفاع در برابر اقدامات غیرقانونی مانند پولشویی استفاده می کند. با مقایسه میلیون ها تراکنش می توان فهمید که کدام یک از آنها نامشروع است.

 

کارایی های بیشتر یادگیری ماشین با پایتون

به غیر از مواردی که ذکر کردیم ، می توانیم از Machine Learning برای اهداف زیر استفاده کنیم :

  • شناسایی ژنهای انسانی که مستعد ابتلا به سرطان هستند.
  • شناسایی محصولاتی که مصرف کنندگان به آن واکنش نشان می دهند.
  • معاملات سهام و مشتقات.
  • بازرسی بسته برای نرم افزار ضد ویروس.
  • تشخیص تاخیر در پروازهای هواپیما.
  • تشخیص تعمیرات و نگهداری کارخانه.
  • تبلیغات رفتاری برای محصولات.

 موارد ذکر شده همگی در مورد برنامه های کاربردی یادگیری ماشین با پایتون میباشد. امیدوارم توضیحات ما در این خصوص  برایتان مفید بوده باشد.

اگر میخواهید فایل پی دی اف  این مقاله را دریافت کنید یا آن  را برای دیگران ارسال کنید در لینک زیر در دسترس میباشد .



:: برچسب‌ها: یادگیری ماشین , ماشین لرنینگ , هوش مصنوعی ,
:: بازدید از این مطلب : 221
|
امتیاز مطلب : 55
|
تعداد امتیازدهندگان : 11
|
مجموع امتیاز : 11
تاریخ انتشار : دو شنبه 25 فروردين 1399 | نظرات ()
نوشته شده توسط : سئوکار

طبق گزارشات از سایت های بررسی مشاغل ، مهندس یادگیری ماشین به دلیل رشد تقاضا و حقوق زیاد بهترین شغل سال 2019 نامیده شده است. متوسط درآمد فعلی این حرفه 146.085 دلاروبا نرخ رشد 344 درصد در سال گذشته برخوردار است.بنابرین در حال حاضرمی توان گفت آینده مشاغل مرتبط با هوش مصنوعی به نسبت سایر حوزه های شغلی بسیار پررونق تر بوده و در این میان مهندسی یادگیری ماشینی در صدر قرار دارد.
شرکت هایی مانند گوگل ، کوئورا و فیس بوک افراد زیادی را با تخصص یادگیری ماشین استخدام می کنند. در دانشگاههای برتر دنیا تحقیقات گسترده ای در زمینه یادگیری ماشین وجود دارد و در شرکت های برتر هیچ محدودیتی در مورد حقوق افراد متخصص یادگیری ماشین وجود ندارد.
ایران نیز در رتبه ی ۱۵ جهان در زمینه هوش مصنوعی قرار دارد و تنها رقیب وی در خاورمیانه کشور ترکیه است. مسلما با پیشرفت روزافزون این حوزه و توسعه کاربرد های آن ایران می تواند به زودی جزو ۱۰ کشور برتر در زمینه یادگیری ماشین و هوش مصنوعی قرار بگیرد. دانشگاه های معتبر ایرانی تحقیقات زیادی در این حوزه انجام می دهند و به پیشرفت های قابل توجهی رسیده اند.
در این مقاله از وبسایت آکادمی آمانج به بررسی بیشتر بازار کار و وضعیت یادگیری ماشین در ایران میپردازیم .

بازار کار یادگیری ماشین در جهان

بازار کار یادگیری ماشین

شبکه اجتماعی لینکدین یکی از شبکه های اجتماعی نسبتا تخصصی است که بر اساس روابط تجاری و شغلی شکل گرفته و اطلاعات مرتبط با مشاغل مختلف در آن قابل دسترسی است. این شبکه اجتماعی به طور دوره ای نسبت به شرایط رشد و آینده مشاغل تحقیقاتی انجام داده و آن را منتشر می کند.

همکاران شبکه اجتماعی لینکدین اطلاعاتی را در مورد مشاغلی که طی چند سال اخیر بیش‌ترین رشد را تجربه کرده‌اند منتشر کرد و بر اساس آن مشخص شد مهارت‌های مرتبط با حوزه فناوری و داده از جمله بخش‌هایی بودند که میزان اشتغال‌زایی در آن‌ها سریع‌ترین رشد را داشته است و به خصوص آن دسته از افرادی که در عرصه مرتبط با داده‌ها فعالیت می‌کنند بیش‌تر از بقیه این رشد را پیش روی خود دیده‌اند.

۱۰ عنوان شغلی برتر با پررونق‌ترین بازارکاری در پنج سال گذشته بر اساس گزارش لینکدین عبارتند از:

  • مهندس یادگیری ماشینی (رشد ۹.۸ برابری تعداد کارفرمایان نسبت به سال ۲۰۱۲)
  • کارشناس داده (رشد ۶.۵ برابری نسبت به سال ۲۰۱۲)
  • توسعه دهنده سیستم‌های فروش (رشد ۵.۷ برابری نسبت به سال ۲۰۱۲)
  • مدیر ارتباط با مشتری (رشد ۵.۶ برابری نسبت به سال ۲۰۱۲)
  • توسعه‌دهنده کلان داده (رشد ۵.۵ برابری نسبت به سال ۲۰۱۲)
  • مهندس پشتیبان (رشد ۵.۵ برابری نسبت به سال ۲۰۱۲)
  • توسعه‌دهنده نرم‌افزارهای کاربردی (رشد ۵.۱ برابری نسبت به سال ۲۰۱۲)
  • مدیر علوم داده (رشد ۴.۹ برابری نسبت به سال ۲۰۱۲)
  • شرکای تجاری برندها (رشد ۴.۵ برابری نسبت به سال ۲۰۱۲)
  •  توسعه‌دهنده سیستم‌های پشتیبانی (رشد ۴.۵ برابری نسبت به سال ۲۰۱۲)

پرتقاضاترین شغل‌ها در حوزه‌ی ماشین لرنینگ و هوش مصنوعی در ایران

۱-مهندس یادگیری ماشین (machine learning engineer)

۲-متخصص داده (data scientist)

۳-متخصص پژوهش (research scientist)

۴-مهندس تحقیق و توسعه (R&D engineer)

۵-توسعه‌دهنده‌ی هوش تجاری (BI developer)

۶-مهندس بینایی ماشین (computer vision engineer)

مهارت های مورد نیاز جهت استخدام در حوزه یادگیری ماشین در ایران

• تسلط به هسته اصلی برنامه نویسی پایتون

• تمسلط به اصول برنامه نویسی شی گرا (به خصوص در پایتون)

• تسلط به برنامه نویسی مهندسی با زبان پایتون

• خلاق در حل مسئله و طراحی و بهینه سازی الگوریتم

• تسلط بر کتابخانه های Numpy, Scipy, Matplotlib

• تسلط به کتابخانه یادگیری ماشین sklearn

• تجربه کار با کتابخانه های Tensorflow و nltk و OpenCV

• آشنایی به طراحی دیتابیس MongoDB

• آشنایی با مفاهیم یادگیری عمیق و پردازش تصویر

به طور کلی برای ورود به دنیای هوش مصنوعی به مهارت‌هایی زیر نیاز داریم

۱-دانش برنامه‌نویسی

۲-دانش ریاضیات و آمار و احتمال

برای فراگیری این مهارت‌ها، می‌توانید از کتاب های مرتبط در این زمینه و دوره‌های آنلاین مختلف استفاده کنید. همچنین، در کانون‌ها و دورهمی‌ها شرکت کنید. علاوه بر این‌ها، می‌توانید بر روی ارتباط کسب‌وکار با هوش مصنوعی مطالعه کنید.

کاربردهای هوش مصنوعی و ماشین لرنینگ در شرکت‌های ایرانی

در کشور ما  شرکت ها و سرمایه گزارانی در حوزه یادگیری ماشین وجود دارند که از اهداف برخی از آن ها می توان به هدایت ایده ها به سمت تولید و عرضه ی محصول قابل اعتماد و با ارزش افزوده بالا جهت رشد و پرورش استعدادها و نیروی متخصص بازار کار اشاره کرد،
SkillUp از سری رویدادهایی است که به شکل فصلی با همکاری کوئرا و دانشگاه شریف با هدف انتقال تجربه در حوزه‌ی جدید تکنولوژی برگزار می‌شود. در این قسمت بخشی از سخنان مدیران و سرمایه گذاران در زمینه یادگیری ماشین را خواهیم داشت :

ماشین لرنینگ در ایران

 

     دکتر محمود کریمیان – مدیرعامل دیدئو

      رضا مرادی – توسعه‌دهنده بک‌اند در سخن

      محسن شجاعی – مدیر فنی پوشه

      هادی راسخ – مدیرعامل سلام‌سینما 

توضیح مختصری درباره‌ی کسب‌وکار خود بفرمایید:

رضا مرادی – توسعه‌دهنده بک‌اند در سخن:

سخن یک کسب‌وکار B2B است که کسب‌وکارها را قادر می‌سازد محصولات و خدمات خود را به صورت گفتاری به مشتریان ارائه دهند و از طریق صوت با آن‌ها ارتباط برقرار کنند.

محسن شجاعی – مدیر فنی پوشه:

پوشه زیرساخت Push Notification است. ما در واقع یک کسب‌وکار B2B هستیم و خدمات ارسال نوتیفیکیشن ارائه می‌کنیم. ما ۸۰ میلیون نصب فعال و حدود ۳۰ میلیون دستگاه یکتا داریم.

هادی راسخ – مدیرعامل سلام‌سینما:

سلام‌سینما چندین سال است که در حوزه‌ی فیلم و سینما فعالیت می‌کند. سلام‌سینما برای سرویس پیشنهاد فیلم خود از هوش مصنوعی استفاده می‌کند.

دکتر محمود کریمیان – مدیرعامل دیدئو:

دیدئو یک جستجوگر ویدیویی است از سال ۹۴ شروع به کار کرده است. دیدئو سعی می‌کند دسترسی به فیلم‌های مختلف پلتفرم‌هایی مانند یویتیوب را ممکن سازد. در حال حاضر حدود ۶ میلیون کاربر ماهانه داریم و هر ماه ۲۵ میلیون ویدیو در آن دیده می‌شود.

یادگیری ماشینی در ایران

هوش مصنوعی چه کاربردهایی در کسب‌وکار شما دارد و چرا به سراغ هوش مصنوعی رفته‌اید؟

رضا مرادی:

تنها راهکار انجام کارهایی که مد نظر ماست، استفاده از هوش مصنوعی است. در تبدیل صوت به متن و درک صوت، پیچیدگی‌های مختلفی وجود دارد. ما باید بتوانیم بدون قاعده‌ی خاصی، این کار را انجام دهیم. ما از ابزارهای شناسایی صوت (Voice Recognition)، پردازش زبان طبیعی (nlp) و موتور تبدیل متن به گفتار (text-to-speech) استفاده می‌کنیم. ما به جاهای مختلفی خدمات ارائه می‌دهیم. به فرودگاه‌ها، ایرانسل، ۷۲۴ و … خدمات می‌دهیم. همچنین ما در حال ساخت سیستمی هستیم تا در سوانح طبیعی با تحلیل تصاویر هوایی و نظرات مردم در شبکه‌های اجتماعی، به امدادرسانی کمک کنیم.

محسن شجاعی:

ما سعی داریم با پیاده‌سازی هوش مصنوعی بر روی سرویس اصلی، مشتریان بیش‌تر و حرفه‌ای‌تری جذب کنیم. برای مثال مارکترها در کمپین‌های خود از A/B Testing استفاده می‌کنند. ما با استفاده از هوش مصنوعی، قبل از انجام اجرای کمپین، CTR را تخمین می زنیم و از این طریق نیاز به انجام تست‌های مختلف را از بین می‌بریم. همچنین، مارکترها می‌توانند با استفاده از سیستم ما، به شکل شخصی‌سازی‌شده برای افراد کمپین اجرا کنند. کار دیگری که ما انجام می‌دهیم، پیش‌بینی نارضایتی کاربران است.

هادی راسخ:

هدف ما از ابتدا استفاده از هوش مصنوعی نبود. از جایی تصمیم گرفتیم هوش مصنوعی را به کار بگیریم تا تجربه‌ی بهتری برای مخاطبان خلق کنیم.

محمود کریمیان:

وقتی دیدئو را شروع کردیم، در مورد حجم داده‌ها دیدی نداشتیم. ابتدا تصمیم گرفتیم ویدیوها را به صورت Bulk وارد سیستم کنیم. اما بعد از مدتی دیدیم، برای وارد کردن محتواهای خوب به پلتفرم، وقت و نیروی زیادی نیاز داریم. ما به سمت فرایند بلک لیستی رفتیم که می‌تواند تشخیص دهد یک محتوا مناسب است یا نه. این فرایند با استفاده از یک درخت دانش (knowledge graph) انجام می‌شود. دیدئو یک موتور پیشنهاددهنده نیز دارد که محتوای ویدیویی مورد علاقه کاربر را به وی نشان می‌دهد.

چالش های استارت آپ ها و سرمایه گذاران هوش مصنوعی و یادگیری ماشین در ایران

یادگیری ماشین

محمد احمدی  مدیر عامل و عضو هیات مدیره شرکت اسمارت آپ ونچرز سال‌هاست که به صورت شخصی در بازارهای مالی (عمدتا سرمایه‌گذاری در استارتاپ‌ها ) مشغول سرمایه گذاری میباشد وی در مصاحبه ای به بخشی از سوالات در خصوص سرمایه گزاری در حوزه هوش مصنوعی و یادگیری ماشین در ایران پاسخ داده که مهمترین آن ها را میخوانیم :

 از علل توجه خودتان به حوزه هوش مصنوعی بگویید.

هوش مصنوعی یکی از حوزه های ماست. دلیل این انتخاب، دید بلند مدتی است که داریم. هوش منصوعی در ایران ممکن است مقداری با مانیتایز شدن و کسب درآمد کردن و استفاده کاربردی و روزمره فاصله داشته باشد. اما حس می‌کنم در آینده جهان و آینده اقتصاد نقش جدی و پررنگی دارد. بنابراین ما نیاز داریم که آن را یاد بگیریم. یادگرفتن هوش مصنوعی تنها با خواندن کتاب و مقاله محقق نمی‌شود. بلکه یک سرمایه‌گذار باید در این حوزه سرمایه گذاری کند تا بتواند با مشکلات و دردسرهایش آشنا بشود.

ما با این دید، دو استارتاپ سرمایه گذاری کردیم؛ این فکت و دیالوگ که در زمینه هوش مصنوعی فعال هستن. اگر به سخنرانی‌هایی که در مورد نوآوری وجود دارد نگاه کنید متوجه می‌شوید که هوش مصنوعی وجه مشترک تمام صحبت های آینده پژوهان است. مثلاً بن هاروویتز با مقایسه نوآوری ۲۰ سال آینده با ۲۰ سال گذشته می‌گفت تمرکز و نقاط کانونی ما از گذشته تا امروز چگونه و چقدر تغییر کرده است؟ علی رغم تفاوت‌هایی که گذشته و آینده داشته و دارد تقریباً در همه آنها هوش مصنوعی و یادگیری ماشین قسمت جدی نوآوری در آینده است.

آیا نسبت علاقه مندی شما به این استارتاپ‌ها متفاوت است ؟ ارجحیت شما برای سرمایه گذاری به سمت هوش منصوعی است یا استارتاپ‌های خدماتی‌تر؟

می شود گفت هرکدام ریسک پروفایل متفاوتی دارند. یعنی بعضی از این استارتاپ ها نوع ریسک‌ها و بازگشت سرمایه‌شان متفاوت است. بعضی از این استارتاپ‌ها ریسک بسیار کمی دارند و به همان نسبت در آینده هم بازگشت سرمایه کمتری احتمالاً داشته باشند. بعضی از آنها ریسک بالقوه زیادی دارند و فاصله شان با کسب درآمد کردن ممکن است بیشتر باشد مانند هوش مصنوعی اما ما حس می کنیم که در آینده می‌توانند نقش جدی در سبد ما داشته باشد. به بیان دیگر؛ باید نسبت به بعضی از سرمایه‌گذاری‌ها دید بلند مدت تری داشته باشیم، مثل هوش مصنوعی اما به بعضی از آنها با اهدف کوتاه مدت‌تر و میان مدت‌تر پرداختیم.

آیا نکات تئوری در عمل هم درحال وقوع است؟ چون اینطور به نظر می‌رسد که بعضی استارت آپ ها ایده‌آل سرمایه‌گذاری هستند اما در عمل چنین اتفاق‌هایی رخ نمی‌دهد.

بله واقعیت دارد؛ مثلاً یکی از استارتاپ‌های ما به نام «گهواره» که به مادران از پیش از بارداری تا ۶ سالگی فرزند محتوا می‌دهد، در این حوزه از هوش مصنوعی استفاده می شود در تشخیص اینکه چه محتواهایی به درد چه افرادی می‌خورد. بنابراین اگر در حوزه سلامت وارد شده باشیم هوش مصنوعی به کار ما می‌آید. همینطور استارتاپ «کرفس» که در زمینه رژیم غذایی فعالیت می‌کند با بیگ دیتاها روبرو است و بنابراین عرصه مستقیم فعالیت هوش مصنوعی برای تشخیص الگوها و الگوریتم‌ها است.

ازسختی ها و چالش های کارسرمایه گذاران و استارتاپ های حوزه هوش مصنوعی در ایران ؟

من جواب این سؤال را به دو قسمت تقسیم می‌کنم؛ از دید سرمایه گذار و از دید استارتاپ. از دید سرمایه گذار چیزی که ماجرا را سخت می‌کند دوره نگهداری طولانی (HPR) است یعنی اینکه چقدر باید در یک سرمایه گذاری بمانی تا به سود برسی  در صنعت سرمایه گذاری این عدد بالاست یعنی عرف دنیا به ۵ تا ۷ سال می‌رسد؛

یعنی ۷ سال باید در استارتاپ بمانی تا با سود خارج شوی. اما سرمایه‌گذارهای ما عادت به سودهای کوتاه مدت دارند یعنی به دلیل واقعیت‌های اقتصادی کشورمان بسیاری از سرمایه گذارانمان دلال مسلک هستند تا حداکثر در سال آینده با سود خوبی خارج شوند. در حالی که این رویکرد برای فضای استارتاپی ممکن نیست.

سختی و مشکل استارتاپ‌ها این است که بسیاری از آنها بر اساس علاقه شان محصول ساخته‌اند نه نیاز بازار. ابتدا باید مشتری را پیدا کرد و بعد برای مشکل اون راهکار ارائه داد. به نظر من بیش از آنکه این مشکل، فنی باشد به نیازسنجی و شناخت بازار مربوط است. یعنی خیلی از استارتاپ‌ها جاهای غلطی را انتخاب می‌کنند.



:: برچسب‌ها: یادگیری ماشین , ماشین لرنینگ , هوش مصنوعی ,
:: بازدید از این مطلب : 207
|
امتیاز مطلب : 55
|
تعداد امتیازدهندگان : 11
|
مجموع امتیاز : 11
تاریخ انتشار : یک شنبه 17 فروردين 1399 | نظرات ()

صفحه قبل 1 صفحه بعد